本文提供了来自RGBD图像和LIDAR点云的3D数据平面分割的EVOPS数据集。我们已经设计了两种注释方法(RGBD和LIDAR)在著名和广泛使用的数据集上进行SLAM评估,我们提供了一套完整的基准测试工具,包括点,飞机和细分指标。数据包括由高质量分段平面组成的不同选定场景上的10K RGBD和7K LIDAR帧的总数。该实验报告了在我们的注释数据上进行RGBD平面分割的SOTA方法的质量。我们还为LIDAR点云中的平面分割提供了可学习的基线。所有标记的数据和基准工具均已在https://evops.netlify.app/上公开提供。
translated by 谷歌翻译
在本文中,我们提出了一种具有高时间同步(同步)精度的记录系统,该精度由智能手机,深度摄像机,IMU等等异质传感器组成,由于智能手机的一般兴趣和大量采用,我们包括至少一个这些设备进入我们的系统。这种异构系统需要两个不同时间权限的混合同步:智能手机和MCU,在那里我们将基于硬件有线的触发同步与软件同步组合起来。我们在用RGB摄像头中汇总与新颖的系统混合有源红外深度的自定义和新颖系统的同步结果。我们的系统实现了时间同步的子毫秒精度。此外,我们的系统在这种精度下同时暴露每个RGB深度图像对。我们特别展示了一个配置,但我们系统背后的一般原则可以被其他项目复制。
translated by 谷歌翻译
使用激光雷达测量值的数据融合算法,例如视觉量,激光惯性或多个激光镜的探光仪以及同时定位和映射(SLAM)依赖于精确的时间戳记方案,这些方案赋予LIDAR和其他传感器的数据同步的精确时间戳记。由于时间戳错误而导致的同步性能差,可能会对算法的状态估计结果产生负面影响。 To provide highly accurate and precise synchronization between the sensors, we introduce an open-source hardware-software LiDAR to other sensors time synchronization system that exploits a dedicated hardware LiDAR time synchronization interface by providing emulated GNSS-clock to this interface, no physical GNSS-需要接收器。该模拟器基于通用微控制器,由于简洁的硬件和软件体系结构,可以轻松修改或扩展,以同步不同传感器的集合,例如摄像机,惯性测量单元(IMUS),Wheel Encoders,其他LIDARS,其他LIDARS,其他LIDAR,等等。在论文中,我们提供了一个具有同步LIDAR和IMU传感器的系统的示例。我们对传感器的同步精度和精度进行了评估,并进行了1微秒性能。我们将我们的结果与ROS软件提供的时间戳和LIDAR内部时钟方案进行了比较,以强调这两种基线方法的明确优势。
translated by 谷歌翻译
联合学习已被引入新的机器学习范式,以增强本地设备的使用。在服务器级别,FL定期聚集在分布式客户端上本地学习的模型,以获得更通用的模型。当前的解决方案依赖于客户端的大量存储数据的可用性,以微调服务器发送的模型。这种设置在移动普遍计算中不现实,在该计算中必须保持数据存储较低,并且数据特征可能会发生巨大变化。为了解释这种可变性,解决方案是使用客户定期收集的数据来逐步调整接收到的模型。但是这种天真的方法使客户面临着灾难性遗忘的众所周知的问题。为了解决这个问题,我们定义了一种联合的持续学习方法,该方法主要基于蒸馏。我们的方法允许更好地利用资源,从而消除了在新数据到达时从头开始重新审阅的需求,并通过限制存储的数据量来减少内存使用量。该提案已在人类活动识别(HAR)领域进行了评估,并已证明可以有效地降低灾难性的遗忘效果。
translated by 谷歌翻译
联合学习已被引入新的机器学习范式,以增强本地设备的使用。在服务器级别,FL定期聚集在分布式客户端上本地学习的模型,以获得更通用的模型。这样,没有通过网络发送私人数据,并且降低了通信成本。但是,当前的解决方案依赖于客户端的大量存储数据的可用性,以微调服务器发送的模型。这种设置在移动普遍计算中不现实,在该计算中必须保持数据存储较低,并且数据特征(分布)可能会发生巨大变化。为了解释这种可变性,解决方案是使用客户定期收集的数据来逐步调整接收到的模型。但是这种天真的方法使客户面临着灾难性遗忘的众所周知的问题。本文的目的是在智能手机的移动人类活动识别环境中证明这个问题。
translated by 谷歌翻译
我们介绍了一种与数据对称性相对的学习表示形式的通用方法。核心思想是将潜在空间分解为不变因素和对称组本身。该组件在语义上分别对应于固有的数据类别,并构成姿势。学习者是自我监督的,并根据相对对称信息来渗透这些语义。该方法是由群体理论的理论结果激励的,并保证了无损,可解释和解开的表示。我们通过涉及具有多种对称性的数据集的实验来实证研究该方法。结果表明,我们的表示形式捕获数据的几何形状,并超过其他模棱两可的表示框架。
translated by 谷歌翻译
我们引入了一种基于最近邻居回归的活动函数近似的算法。我们的活跃邻居回归器(ANNR)依靠Voronoi-Delaunay框架从计算几何形状到具有恒定估计函数值的空间将空间细分为恒定的函数值,并以一种将函数图的几何形状计入的方式选择新的查询点。我们将最新的最新活动函数近似值(称为defer)视为基于空间的增量矩形分区,为主基线。ANNR解决了由延期中使用的空间细分策略产生的许多局限性。我们提供了我们方法的计算有效实施以及理论停止保证。经验结果表明,Annr优于封闭形式函数和现实示例的基线,例如引力波参数推断和生成模型潜在空间的探索。
translated by 谷歌翻译
文学文本通常丰富,他们的解释使语料库研究和自动加工复杂化。有几次尝试创建文学文本的集合,并注释文学元素,如作者的语音,字符,事件,场景等。然而,它们导致了注释的小集合和独立的规则。本文介绍了文学世界中文学世界的词汇诠释的实验,以及他们对比较的定量方法。实验表明,对于一致的标签分配,注释规则应该更严格地设定。但是,如果文本世界和其他元素之间的边界是主观解释的结果,它们应该被建模为模糊实体。
translated by 谷歌翻译
高赌注应用中产生的许多黑匣子优化任务需要风险厌恶的决策。但标准贝叶斯优化(BO)范式仅优化了预期值。我们概括了博的商业卑鄙和输入依赖性方差,我们认为我们认为是未知的先验。特别是,我们提出了一种新的风险厌恶异源贝类贝叶斯优化算法(Rahbo),其旨在识别具有高回报和低噪声方差的解决方案,同时在飞行时学习噪声分布。为此,我们将期望和方差模拟(未知)RKHS函数,并提出了一种新的风险感知获取功能。我们对我们的方法绑定了遗憾,并提供了一个强大的规则,以报告必须识别单个解决方案的应用程序的最终决策点。我们展示了Rahbo对合成基准函数和超参数调整任务的有效性。
translated by 谷歌翻译
近年来,深度学习在许多实际问题中取得了重大结果,例如计算机视觉,自然语言处理,语音识别等。多年来,该研究的主要目标是提高模型的质量,即使复杂性不切实际。但是,对于通常需要实时工作的生产解决方案而言,该模型的延迟起着非常重要的作用。通过将模型复杂性考虑到神经体系结构搜索(NAS),发现了当前的最新架构。但是,设计适合特定硬件的搜索空间仍然是一项艰巨的任务。为了解决这个问题,我们提出了神经体系结构搜索空间的硬件效率的度量 - 矩阵效率度量(MEM);由硬件有效操作组成的搜索空间;一种延迟感知的缩放方法;和Isynet-一组架构,旨在在专门的神经加工单元(NPU)硬件上快速进行快速,同时准确。我们展示了NPU设备在ImageNet上设计的架构的优势以及下游分类和检测任务的概括能力。
translated by 谷歌翻译